如何实现用PHP和Shell写Hadoop的MapReduce程序

您所在的位置:网站首页 Shell编程 PHP 如何实现用PHP和Shell写Hadoop的MapReduce程序

如何实现用PHP和Shell写Hadoop的MapReduce程序

2023-04-07 16:20| 来源: 网络整理| 查看: 265

 当前位置:首页 » 编程设计 » 正文 如何实现用PHP和Shell写Hadoop的MapReduce程序 2023年04月07日3wayfarer

使得任何支持标准IO (stdin, stdout)的可执行程序都能成为hadoop的mapper或者 reducer。例如:

复制代码 代码如下:

hadoop jar hadoop-streaming.jar -input SOME_INPUT_DIR_OR_FILE -output SOME_OUTPUT_DIR -mapper /bin/cat -reducer /usr/bin/wc

在这个例子里,就使用了Unix/Linux自带的cat和wc工具来作为mapper / reducer,是不是很神奇?

如果你习惯了使用一些动态语言,用动态语言来写mapreduce吧,跟之前的编程没有任何不同,hadoop只是运行它的一个框架,下面我演示一下用PHP来实现Word Counter的mapreduce。

一、找到Streaming jar

Hadoop根目录下是没有hadoop-streaming.jar的,因为streaming是一个contrib,所以要去contrib下面找,以hadoop-0.20.2为例,它在这里:

复制代码 代码如下:

$HADOOP_HOME/contrib/streaming/hadoop-0.20.2-streaming.jar

二、写Mapper

新建一个wc_mapper.php,写入如下代码:

复制代码 代码如下:

#!/usr/bin/php



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3